home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 4821 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  5.7 KB

  1. Path: informatik.tu-muenchen.de!fischerj
  2. From: fischerj@informatik.tu-muenchen.de (Juergen "Rally" Fischer)
  3. Newsgroups: comp.sys.amiga.programmer
  4. Subject: Re: doubling pixels horizontally
  5. Date: 5 Mar 1996 14:38:55 GMT
  6. Organization: Technische Universitaet Muenchen, Germany
  7. Distribution: world
  8. Message-ID: <4hhjlv$5qb@sunsystem5.informatik.tu-muenchen.de>
  9. References: <4f4ibc$gl9@news.cs.tu-berlin.de> <591.6610T1165T2102@login.eunet.no><1045.6611T753T2256@vip.cybercity.dk><4faoe1$47@sunsystem5.informatik.tu-muenchen.de><2991.6612T1034T625@vip.cybercity.dk><576.6613T1070T1730@login.eunet.no><1257.6614T57T922@vip.cybercity.dk>   <1982.6617T1096T103@ifi.uio.no> <4gbjg3$104@sunsystem5.informatik.tu-muenchen.de>  <4518.6625T1142T92@ifi.uio.no> <4h4hv5$mnn@sunsystem5.informatik.tu-muenchen.de> <2444.6635T982T1557@ifi.uio.no>
  10. NNTP-Posting-Host: hphalle6g.informatik.tu-muenchen.de
  11. Originator: fischerj@hphalle6g.informatik.tu-muenchen.de
  12.  
  13.  
  14. In article <2444.6635T982T1557@ifi.uio.no>, ludvigp@ifi.uio.no (Ludvig Pedersen) writes:
  15. |> Organization: Dept. of Informatics, University of Oslo, Norway
  16. |> Lines: 70
  17. |> Message-ID: <2444.6635T982T1557@ifi.uio.no>
  18. |> References: <4f4ibc$gl9@news.cs.tu-berlin.de> <591.6610T1165T2102@login.eunet.no><1045.6611T753T2256@vip.cybercity.dk><4faoe1$47@sunsystem5.informatik.tu-muenchen.de><2991.6612T1034T625@vip.cybercity.dk><576.6613T1070T1730@login.eunet.no><1257.6614T57T922|> @vip.cybercity.dk>
  19. |>      <1982.6617T1096T103@ifi.uio.no> <4gbjg3$104@sunsystem5.informatik.tu-muenchen.de>
  20. |>     <4518.6625T1142T92@ifi.uio.no> <4h4hv5$mnn@sunsystem5.informatik.tu-muenchen.de>
  21. |> NNTP-Posting-Host: gymir.ifi.uio.no
  22. |> X-Newsreader: THOR 2.22 (Amiga;TCP/IP)
  23. |> 
  24. |> >Maybe I'm the only one but I can read/build code much better that way.
  25. |> >And I could read my code well :)
  26. |> 
  27. |> WOW!...do you have any super-natural powers? ;^)
  28.  
  29. grrrrrrrrrrrrrrr :) no that's just a subjective thing.
  30.  
  31. Code gets more structured (grrr don't laugh ;) and though more overview.
  32. Puting instructions next to each other which are related to each other
  33.  
  34. subq.w #1,a5 : cmp.w #0,a5 : bne loop ;out of data registers
  35.  
  36. just one structure level more, code gets 2 dimensional (blah:) like
  37. in C code. And as asm needs more instructions than C, it needs the
  38. 2 dimensional format even more if you don't wanna lose overwiev. baeh!
  39. :)
  40.  
  41. |> 
  42. |> >|> >I would be happy if we could get a 3pass almost at copy speed.
  43. |> >|> >(well copy speed, that's 7mb/sec on 030 ? or are we refering to
  44. |> >|> >the 4mb/sec on 020-14 ?)
  45. |> >|> On my A1200 7mb/sec is not copy speed but chip write speed.
  46. |> >mhm, all people told me the blizzard will _copy_ 7mb/sec.
  47. |> >a myth ?
  48. |> 
  49. |> I think so. But please show me the copy-loop and I'll test it.
  50.  
  51. could you please try movem.l (fast)+,d0-d7 and then 8 times move.l dn,(chip)+ ?
  52.  
  53. imho this should do 7mb/sec in the store part. if the movem
  54. is very fast, you aproximate the 7mb/sec also doing copying.
  55.  
  56. On 020-14 it will be slower than normal copy, on 020-28 maybe already 
  57. faster (only theory!)
  58.  
  59. so we still need a test if it's faster than move.l (fast)+,(chip)+
  60.  
  61. |> 
  62. |> BTW:
  63. |> 
  64. |> The Blizzard can WRITE 7 MB/s to chipram.
  65. |> 
  66. |> Here is my results from bustest:
  67. |> 
  68. |> BusSpeedTest 0.07 (mlelstv) Buffer:    16384 Bytes
  69. |> ==================================================
  70. |> loop overhead:      4.5ns
  71. |> register move:     40.6ns
  72.  
  73. huh ? a register move is 2 cycles. you got 24.63 MHz ?
  74.  
  75. |> memtype   op      cycle      bandwidth
  76. |> fast      readw   109.1ns   18.3MByte/s
  77. |> fast      readl   137.6ns   29.1MByte/s
  78. |> fast      readm   167.7ns   23.8MByte/s
  79.  
  80. readm slower ? hmhmhmhm. nooo.
  81. if you use enough regs it's faster on 020-14.
  82. also reading from chip is faster with readm... mhmhm
  83.  
  84. |> fast      writew  120.2ns   16.6MByte/s
  85. |> fast      writel  120.7ns   33.1MByte/s
  86. |> fast      writem  109.9ns   36.4MByte/s
  87. |> chip      readw   589.9ns    3.4MByte/s
  88. |> chip      readl   590.3ns    6.8MByte/s
  89. |> chip      readm   640.5ns    6.2MByte/s
  90. |> chip      writew  572.9ns    3.5MByte/s
  91. |> chip      writel  573.6ns    7.0MByte/s
  92. |> chip      writem  573.3ns    7.0MByte/s
  93. |> rom       readw   109.0ns   18.3MByte/s
  94. |> rom       readl   137.6ns   29.1MByte/s
  95. |> rom       readm   167.3ns   23.9MByte/s
  96. |> 
  97. |> Please not that this is write-speed and NOT copy speed.
  98. |> 
  99. |> >|> I did a simple test and I was able to copy 4.9mb/sec from fastram to
  100. |> >|> chipram on a 256 colors screen.
  101. |> >what size ?  overscan, 320x256,320x200 ? pal ?
  102. |> 
  103. |> PAL-lowres, no overscan.
  104.  
  105. maybe you can write in 10 14-mhz cycle parts, i.e 5.672mb/sec theoretic
  106. if no dma at all.
  107.  
  108. |> 
  109. |> >|> I don't get it??? ;) It is optimal. That was actually VERY easy. Remeber
  110. |> >|> that we are taking about 2x2 without sprite-dithering!!
  111. |> >either you misuse a plane as mask, so 128 colors only, or the 2x2
  112. |> >routine is slower than 3pass, i.e. not optimal :)
  113. |> 
  114. |> The blitter uses only 2 passes and *is* optimal. And its 256 colors.
  115. |> 
  116. hehe, 2 passes blitter is slower than 1 pass blitter ;)
  117. there's a misunderstanding in the word "optimal".
  118. while there realy might be no way to do faster the way you do,
  119. there's another way to do it :) the other way has disadvantages
  120. (monitor sideefects ;) though.
  121.  
  122. |> >|> >I currently got problems with my way of calling qblit. You got a demo
  123. |> >|> >executable ? Mine locks up with small OS-blits :\
  124. |> >|> I don't have that problem. You can look at the source. It will be released
  125. |> >didn't test it yet, but seems that peter found the bug:
  126. |> >I busywait for qblit ready (normaly it is ready).
  127. |> >So another lower pri task can't disown blitter.
  128. |> 
  129. |> Yes, I know.
  130. |> 
  131. |> 
  132. |> <sb>Ludde - Amiga Demo Coder
  133. |> <sb>Virtual Reality & Official Be developer
  134. |> <sb>ludvigp@ifi.uio.no
  135. |> 
  136. ------------------------------------------------------------------------
  137.    fischerj@Informatik.TU-Muenchen.DE (Juergen "Rally" Fischer)   =:)
  138.  
  139.